Efficient construction of the lattice of frequent closed patterns and simultaneous extraction of generic bases of rules
نویسندگان
چکیده
RÉSUMÉ – Durant ces dernières années, les quantités de données collectées, dans divers domaines d’application de l’informatique, deviennent de plus en plus importantes. Ces quantités suscitent le besoin d’analyse et d’interprétation afin d’en extraire des connaissances utiles. Dans ce travail, nous nous intéressons à la technique d’extraction des règles d’association à partir de larges contextes. Cette dernière est parmi les techniques les plus fréquemment utilisées en fouille de données. Toutefois, le nombre de règles extraites est généralement important avec en outre la présence de règles redondantes. Dans ce papier, nous proposons un nouvel algorithme, appelé PRINCE, dont la principale originalité est de construire une structure partiellement ordonnée (nommée treillis d’Iceberg) dans l’objectif d’extraire des ensembles réduits de règles, appelés bases génériques. Ces bases forment un sous-ensemble, sans perte d’information, des règles d’association. Pour réduire le coût de cette construction, le treillis d’Iceberg est calculé grâce aux générateurs minimaux, associés aux motifs fermés fréquents. Ces derniers sont simultanément dérivés avec les bases génériques grâce à un simple parcours ascendant de la structure construite. Les expérimentations que nous avons réalisées sur des contextes de référence et « pire des cas » ont montré l’efficacité de l’algorithme proposé, comparativement à des algorithmes tels que CLOSE, A-CLOSE et TITANIC.
منابع مشابه
Avoiding the itemset closure computation ”pitfall”
Extracting generic bases of association rules seems to be a promising issue in order to present informative and compact user addedvalue knowledge. However, extracting generic bases requires partially ordering costly computed itemset closures. To avoid the nightmarish itemset closure computation cost, specially for sparse contexts, we introduce an algorithm, called Prince, allowing an astute ext...
متن کاملThematization Strategies in the Generic Moves of Research Article Introductions
Despite the heterogeneity of ideas regarding the definitions of genre, there are also common instances shared among scholars interested in particular aspects of the notion. Swales (1990) and Bhatia (1993) are primarily interested in the sociological and psychological aspects of genre's functioning and construction, respectively.. Swales analyzes the genre of 'article introduction', into four ge...
متن کاملMining Bases for Association Rules using Galois Closed Sets
We address the problem of the usefulness of the set of discovered association rules. This problem is important since real-life databases yield most of the time several thousands of rules with high confidence. We propose new algorithms based on Galois closed sets to reduce the extraction to bases for exact and approximate rules. Once frequent closed itemsets – which constitute a generating set f...
متن کاملConvertible limited (multi-) verifier signature: new constructions and applications
A convertible limited (multi-) verifier signature (CL(M)VS) provides controlled verifiability and preserves the privacy of the signer. Furthermore, limited verifier(s) can designate the signature to a third party or convert it into a publicly verifiable signature upon necessity. In this proposal, we first present a generic construction of convertible limited verifier signature (CLVS) into which...
متن کاملPRINCE: Extraction optimisée des bases génériques de règles sans calcul de fermetures
The problem of the relevance and the usefulness of extracted association rules is becoming of primary importance, since an overwhelming number of association rules may be derived even from reasonably sized databases. This requires the extraction of generic bases of association rules, of reduced size and which summarize the same information. Using the concept of minimal generator, we propose an ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- CoRR
دوره abs/1312.1558 شماره
صفحات -
تاریخ انتشار 2013